期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 面向语音增强的双复数卷积注意聚合递归网络
余本年, 詹永照, 毛启容, 董文龙, 刘洪麟
《计算机应用》唯一官方网站    2023, 43 (10): 3217-3224.   DOI: 10.11772/j.issn.1001-9081.2022101533
摘要138)   HTML4)    PDF (1993KB)(83)    收藏

针对现有的语音增强方法对语谱图特征关联信息表达有限和去噪效果不理想的问题,提出一种双复数卷积注意聚合递归网络(DCCARN)的语音增强方法。首先,建立双复数卷积网络,对短时傅里叶变换后的语谱图特征进行两分支信息编码;其次,将两分支中编码分别使用特征块间和特征块内注意力机制对不同的语音特征信息进行重标注;再次,使用长短期记忆(LSTM)网络处理长时间序列信息,并用两解码器还原语谱图特征并聚合这些特征;最后,经短时逆傅里叶变换生成目标语音波形,以达到抑制噪声的目的。在公开数据集VBD(Voice Bank+DMAND)和加噪的TIMIT数据集上进行的实验的结果表明,与相位感知的深度复数卷积递归网络(DCCRN)相比,DCCARN在客观语音感知质量指标(PESQ)上分别提升了0.150和0.077~0.087。这验证了所提方法能更准确地捕获语谱图特征的关联信息,更有效地抑制噪声,并提高语音的清晰度。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 面向语音增强的双复数卷积注意聚合递归网络
余本年 詹永照 毛启容 董文龙 刘洪麟
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081. 2022101533
录用日期: 2022-12-28